V2EX  ›  英汉词典

Site Reliability Engineering

定义 Definition

站点可靠性工程(SRE):一种把软件工程方法应用到运维与生产系统管理中的实践与岗位方向,目标是在可靠性(稳定性、可用性)与交付速度/成本之间取得平衡。常见工作包括:设定与度量服务目标(如 SLI/SLO)、自动化运维、监控告警、容量规划、故障应急与复盘等。该术语最常与 Google 的工程实践相关。

发音 Pronunciation (IPA)

/saɪt rɪˌlaɪəˈbɪləti ˌɛnʤɪˈnɪrɪŋ/

例句 Examples

We’re hiring a site reliability engineering team to improve uptime.
我们正在招聘站点可靠性工程团队来提升系统在线率。

Site reliability engineering helps define service-level objectives and reduces outages through automation and careful monitoring.
站点可靠性工程通过定义服务级别目标,并借助自动化与严密监控来减少故障宕机。

词源 Etymology

该短语由 site(站点/系统)+ reliability(可靠性)+ engineering(工程/工程化)构成。现代语境下的 SRE 概念在 2000 年代由 Google 内部实践体系化并推广开来,强调用工程化手段(代码、自动化、标准化)来管理大规模线上系统的可靠性。

相关词 Related Words

文学与著作 Literary Works

  • Site Reliability Engineering: How Google Runs Production Systems(Betsey Beyer, Chris Jones, Jennifer Petoff, Niall Richard Murphy)
  • The Site Reliability Workbook: Practical Ways to Implement SRE(Beyer, Jones, Petoff, Murphy)
  • Building Secure and Reliable Systems(Google 出版团队,多位作者;涵盖可靠性与运维工程化实践并与 SRE 体系高度相关)
  • Accelerate: The Science of Lean Software and DevOps(Nicole Forsgren, Jez Humble, Gene Kim;讨论与 SRE/可靠性交付相关的度量与实践)
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   779 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 13ms · UTC 18:52 · PVG 02:52 · LAX 10:52 · JFK 13:52
♥ Do have faith in what you're doing.